累積関数とヒストグラム　-　02

・単一指数関数

単一指数関数の確率密度は，

\(\Large \displaystyle P(x) = k \ exp (-k \ x) \)

です．この場合の累積密度関数は，

\(\Large \displaystyle \int_0^x k \ exp (-k \ x') dx' = -\frac{k}{k} \left[ exp (-k \ x') \right]_0^x = 1 - exp (-k \ x) \)

となります．

解法１：

累積密度関数で推定したパラメータを基に，ヒストグラムを作成した場合，

この図のように，bin（d）ごとに集計します．

その総和は推定したデータ数，N，となりますので，

\(\Large \displaystyle N = C \cdot \sum_{i=0}^\infty \left[ exp (-k \ d \ i) \right] \)

となります，このCを求めたいわけです．

\(\Large \displaystyle y = \sum_{i=0}^\infty \left[ exp (-k \ d \ i) \right] = 1 + exp (-k \ d) + exp (-2 k \ d) + exp (-3 k \ d)...... \)

\(\Large \displaystyle y \cdot exp (-k \ d) = \hspace{74 pt} exp (-k \ d) + exp (-2 k \ d) + exp (-3 k \ d)...... \)

となるので，二つの式の引き算をとると，

\(\Large \displaystyle y - y \cdot exp (-k \ d) =1 \)

\(\Large \displaystyle y =\frac{1}{1- exp (-k \ d)} \)

となるので，

\(\Large \displaystyle N = C \cdot \frac{1}{1- exp (-k \ d)} \)

となり，結局Cは，

\(\Large \displaystyle C = N \cdot [ 1- exp (-k \ d) ] \)

となるので，ヒストグラムは，Cの高さを基準にした指数関数となります．

解法２：

指数関数で表した場合，0～ｄの割合は，

\(\Large \displaystyle \int_0^d exp (-k \ x) \ dx = -\frac{k}{k} \left[ exp (-k \ x) \right]_0^d = 1- exp (-k \ d)\)

となるので，全体の数，Ｎ，のうち

\(\Large \displaystyle N \cdot [1- exp (-k \ d) ] \)

が基準となります．

・実際の計算

実際に，ランダム関数から指数分布を作成して（詳細はここ），ｋ，ｄを色々変えて計算させると，

k=0.1, d=1, N=1000, -> 95.16

k=0.1, d=0.5, N=1000, -> 48.77

k=0.2, d=0.5, N=1000, -> 95.16

ときれいにフィットできました．

ちなみに，エクセルで散布図で棒グラフを作る方法は，ここ，を参考にしました．

短いデータが欠損している場合

ここ，で説明しているように，累積関数でのフィットは短いデータが欠損している場合に有効です．

その際には，

\(\Large \displaystyle \frac{ [A_0]}{k} \cdot \left( 1 - e^{-kt} \right) + D \)

でフィットできることを示しました．書き換えると，

\(\Large \displaystyle N_1 \cdot \left( 1 - e^{-kt} \right) + N_2 \)

という関数で表すことができます．ここで，ヒストグラムにフィットさせる場合には，欠損しているデータ数も加えなくてはならないので，

\(\Large \displaystyle N = N_1 + N_2 \)

として計算することになります．

次は，二つの指数関数の和，の場合です．